Crawl Budget

Crawl Budget（爬取预算 / 抓取预算 / 檢索預算） 是搜索引擎（主要是 Google）在一定时间段内愿意且能够为你的网站分配的爬取资源总量。简单说，就是 Googlebot（谷歌爬虫）每天/每周愿意花多少时间和请求量来访问、抓取和处理你网站上的页面。

Google 官方的定义（来自 developers.google.com）：

Crawl budget 是 Googlebot 能爬取（crawl capacity） 且 想爬取（crawl demand） 的 URL 集合。

它由两大核心因素决定：

这是 Googlebot 技术上能承受的爬取量，主要受以下影响：

这是 Google 想不想 多爬你的站，主要看：

小型博客：只有几百页，Google 几乎每次访问都爬完 → crawl budget 基本不成问题。
大型电商/新闻站：有 100 万+ 页面，每天 Google 只爬 10 万页 → crawl budget 就很关键。
- 如果 Google 把预算浪费在低质量页面（参数 URL、重复内容、过期活动页）上，新产品页或重要文章可能好几天甚至几周都爬不到，导致无法及时索引 → 排名慢、流量损失。

正如我们之前聊的，多语言站点 URL 数量往往成倍增加（/en/、/fr/、/de/ 等），很容易把 crawl budget “撑爆”。如果不优化，Google 可能：

Google 官方说：大多数小于几千页的站点不用太担心。但如果你遇到以下情况，就该重视：

一句话总结：Crawl budget 不是让你“多给 Google 预算”，而是让你把有限的预算花在刀刃上——确保 Google 最先、最多爬取和索引你真正想排名的优质页面。